1
超越聊天机器人:自主代理的架构
EvoClass-AI005第5讲
00:00

欢迎进入从被动使用AI到主动调度AI的转变。要理解“数字员工”,我们必须首先区分标准聊天机器人与一个自主代理。传统的大语言模型交互是被动响应的——依赖于简单的输入 → 输出模式,而自主代理则在一个由公式定义的递归循环中运行:

$$ \text{目标} + \text{推理} + \text{工具} = \text{结果} $$

1. 大语言模型作为中央处理单元

在此架构中,大型语言模型(LLM)充当“大脑”或中央处理器。它提供核心逻辑和语言能力,但要使其像员工一样发挥作用,必须有支持持久化和执行的框架支撑。

2. 代理架构的三大支柱

为了让这个“大脑”有效运作,它依赖于三大支柱:

  • 规划:将复杂目标分解为子任务。
  • 记忆:保留来自先前交互和长期数据的上下文信息。
  • 行动:通过工具在数字世界中执行任务。

我们不再只是简单地发出指令;而是在设计一个能够感知环境并在遇到错误时自我修正的系统。

代理逻辑结构
问题 1
在这个架构中,什么代表了自主代理的“大脑”?
数据库
大型语言模型(LLM)
用户界面
问题 2
哪个支柱负责将复杂的项目分解为可管理的子任务?
行动
记忆
规划
挑战:识别代理行为
分析一个自主代理的工作流程。
你要求 AI 找到三趟飞往纽约的航班,选出最便宜的一趟,并起草一封发给经理的邮件。
第一步
识别该工作流程中的“推理”步骤。
解答:
推理发生在代理比较三趟航班的价格,并根据用户的标准选择最低价的那一趟时。